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基于 二 分 搜索 密度 峰 算 法 的 RBFNN 在 月 降水 预报 中 的 应 用 
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摘 要 : 针对 径 向 基 函 数 (RBF) 网 络 结构 和 初始 数据 中 心 难以 客观 确定 的 不 足 ， 采 用 二 分 搜索 密度 峰值 聚 类 算法 
(TSDPCA) 找到 数据 中 心 值 及 数据 化 类 个 数 作为 RBF 神经 网 络 的 初始 参数 和 隐藏 层 节点 数 ， 再 利用 梯度 下 降 法 优化 

RBFNN 结构 及 各 个 参数 建立 预报 模型 , 并 应 用 于 广西 月 降水 预报 中 ,以 检验 该 模型 的 有 效 性 。 结果 表 明 , 与 K-RBFNN 

和 OLS-RBFNN 的 模型 相 比 ，TSDPCA-RBFNN 预报 平均 相对 误差 值 下 降 了 10%~35%， 具 有 更 好 的 预报 性 能 。 
关键 词 : 二 分 法 ; 密度 峰 ; 径 向 基 神 经 网 络 ; 降水 预报 ; 梯度 下 降 法 
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Application of RBFNN based on TSDPCA in monthly runoff forecasting 
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Abstract: Aiming at the shortages of the RBFNN network structure and initial data center being difficult to objectively 
determined, this paper puts forward using two searching density peak clustering algorithm (TSDPCA) to find data center value 
and number as the initial parameters of RBFNN and the number of hidden layer nodes quickly, and finally using gradient descent 
method of optimization the structure of RBFNN and various parameters to set up precipitation forecast model, which was applied 
in forecasting monthly rainfall of Guagnxi, aiming to testing the effectiveness of the model. The result shows that the mean 
relative error of TSDPCA-RBFNN forecasting was decreased by 10%-35% compared with K-RBFNN and OLS-RBFNN model, 


which has better prediction performance. 
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普通 、 最 典型 的 神经 网 络 训练 算法 , 但 基于 梯度 下 降 法 的 BP 算 
法 要 依赖 初始 权 值 的 选择 ， 再 加 上 实际 问题 则 是 极其 复杂 的 多 
长 期 降水 预报 是 对 一 个 月 或 一 个 季度 的 降雨 量 的 预测 ， 在 维 曲面 ， 并 存在 多 个 局 部 极 值 点 ， 所 以 BP 网 络 算法 存在 收敛 
防洪 防 灾 、 水 库 调 度 和 农业 灌溉 等 各 方面 都 有 很 重要 的 意义 ， 速度 慢 和 易 陷 入 局 部 最 优 . RBFNN 是 一 种 结构 简单 、 运 算 速度 
寺 别 是 在 农业 气象 上 ， 准 确 率 高 的 长 期 降水 预报 能 够 给 经 济 产 快 和 很 强 的 非 线 性 映射 功能 的 三 层 前 馈 神经 网 络 ， 更 加 适合 用 
生 巨 大 的 效益 。 由 于 广西 地 形 特 殊 复杂 ， 天 气 气候 多 变 。 在 长 于 具有 非 线 性 时 间 序 列 的 预测 问题 671H。 但 RBFNN 的 性 能 主 
期 天 气 预 报 中 ， 主 要 采用 的 是 线性 统计 预测 方法 ， 而 这 些 方法 要 受到 其 本 身 拓 扑 结构 因素 的 影响 ， 即 隐藏 层 基 函 数 的 中 心 、 
在 处 理 复杂 的 非 线性 降雨 问题 时 具有 一 定 的 局 限 性 中。 因此 ， 隐藏 层 的 个 数 和 扩展 宽度 这 三 个 参数 难以 确定 。 到 目前 为 止 ， 
深入 研究 气象 长 期 降水 预报 的 新 技术 , 提高 实际 预报 的 精确 度 ， 还 没 找 到 一 种 合适 的 方法 来 确定 以 上 参数 。 很 多 研究 者 将 聚 类 
是 一 项 十 分 重要 的 研究 课题 。 方法 的 思想 应 用 优化 RBFNN 结构 设计 中 ,提出 了 基于 近邻 、 
近年 来 ， 神 经 网 络 方法 在 气象 预测 中 显示 出 了 更 好 的 预报 ”KK- 均 值 聚 类 、K- 中 心 聚 类 、 正 交 最 小 二 乘法 (OLS) 和 自 组 织 
能 力 P5。 这 为 大 气 科学 领域 的 气候 分 析 和 和 气候 预报 提供 了 新 的 映射 “SOM) 聚 类 等 拓扑 结构 的 设计 方法 优化 RBFNN 网 络 结 
技术 和 方法 。 其 中 应 用 最 多 的 为 BP 神经 网 络 和 径 向 基 神 经 网 构 ， 并 取得 了 一 系列 的 成 果品 。2014 年 6 月 ，Rodriguez 等 
络 (radial basis function neural network，RBFNN)。BP 算法 是 最 人 09 提 出 了 一 种 新 的 聚 类 方法 ， 基 于 相互 距离 ， 即 利用 欧 氏 距 
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离 计算 样本 数据 点 间 的 距离 ， 通 过 局 部 密度 和 到 更 高 密度 点 的 
最 短 距离 这 两 个 属性 来 构造 察 类 的 决策 图 ， 然 后 操作 者 选取 这 
两 个 属性 值 都 大 的 数据 点 作为 聚 类 中 心 。 该 方法 具有 简洁 、 计 
算 速度 快 、 能 识别 各 种 形状 的 簇 类 等 优点 。 但 针对 多 维 复杂 的 
数据 时 ， 采 用 欧式 距离 度量 相似 性 存在 鲁 棒 性 和 物理 概念 不 明 
确 等 不 足以 及 存在 聚 类 不 稳定 性 。 文 献 [17] 提 出 采用 密度 峰 改 
进 的 K-medoids 聚 类 获得 新 的 聚 类 准则 函数 ， 提 高 了 聚 类 的 精 
度 和 收敛 速度 , 同时 对 噪声 有 和 较 好 的 鲁 棒 性 。 文献 [18] 为 了 解决 
K- 中 心 等 聚 类 方法 易 陷 入 局 部 最 优 解 的 问题 采用 密度 信息 对 
其 进行 改进 并 应 用 雷暴 分 类 中 ， 有 具有 精确 度 高 和 收敛 速度 快 等 
优点 。 文 献 [19] 利 用 密度 参数 改进 K- 均 值 算法 对 样本 数据 进行 
聚 类 获取 中 心 作为 RBF 基 函 数 的 中 心 , 其 预报 精度 均 高 于 标 # 
的 -均值 RBFNN 预测 模型 和 BP 网 络 预测 模型 ， 但 RBF 网 络 
的 节点 个 数 玉 值 是 根据 经 验 公式 和 网 络 试 算 进行 长 时 间 和 大 量 
的 实验 摸索 后 确定 的 ， 能 找到 较 合 适 的 网 络 模型 ， 而 且 在 很 大 


f =- ”程度 上 依赖 于 具体 处 理 的 问题 ， 同 时 也 需要 使 用 者 具有 神经 网 
Cs 络 和 问题 领域 两 方面 的 先 验 知识 。 还 没有 找到 一 种 能 自动 地 获 
9。 取 网 络 节点 个 数 和 中 心 点 的 方法 。 
Es 本 文 针对 上 述 的 不 足 ， 提 出 一 种 二 分 搜索 密度 峰 聚 类 算法 
OO (‘twosearch density peak clustering algorithm,TSDPCA) 自动 快 
LO 速 地 获取 聚 类 中 心 和 聚 类 个 数 来 优化 RBF 神经 网 络 结构 。 首 
@@ 先 ， 利 用 余弦 夹 角 相似 度 计算 样本 数据 间距 离 ， 更 多 地 注重 了 
a 维度 间 相 对 层面 的 差异 ， 克 服 了 欧 氏 距离 存在 的 缺陷 ， 同 时 
”有 平移 和 旋转 不 变性 的 优点 :其 次 ,根据 用 户 设 定 的 d, 值 计算 
GN 数据 集 的 局 部 密度 记 和 (其 对 应 的 距离 )， 和 = 记 E 对 进行 排 
_ 仁 。 序 取 最 大 的 两 个 点 作为 聚 类 中 心 点 ， 按 离 最 近邻 的 高 密度 的 最 
小 距离 规划 到 相应 的 两 个 类 簇 中 ， 将 第 二 个 类 簇 重复 上 述 方法 
继续 分 为 两 个 类 簇 ， 直 到 相 邻 两 个 簇 之 间 变 化 很 小 时 ， 停 止 继 
三 续 分 类 , 并 保存 聚 类 的 中 心 值 和 聚 类 的 个 数 ;最 后 利用 TSDPCA 
人 方法 和 梯度 下 降 法 化 混合 优化 RBFNN 参数 和 结构 建立 预报 模 


型 ， 并 应 用 于 广西 桂林 地 区 月 降水 量 的 预测 ， 结 果 表 明 ， 网 络 
收敛 速度 快 、 预 报 精确 度 较 高 。 


1 ， 径 向 基 上 函数 神经 网 络 


1.1 RBFNN 结构 
RBFNN 是 一 种 由 输入 层 、 隐 藏 层 和 输出 层 三 层 构成 的 前 
馈 神 经 网 络 2020。 其 网 络 拓扑 结构 如 图 1 所 示 。 其 基本 原理 是 
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薪 林 利 ， 等 ， 基于 二 分 搜索 密度 峰 算法 的 RBFNN 在 月 降水 顺 报 中 的 应 用 
数学 方式 表示 为 
2 
k En 有 过世 ， 
Y'=F(X,) -0 ee Q) 


其 中 : @; 是 隐藏 层 到 输出 层 的 连接 权 值 。 


输入 层 


图 1 RBF 神经 网 络 结构 


1.2 RBFNN 梯度 下 降 学 习 法 


通过 最 小 化 目标 函数 采用 梯度 下 降 法 实现 对 各 隐 节 点 数据 
中 心 、 隐 藏 层 的 扩展 常数 以 及 隐 层 到 输出 层 间 权 值 的 调整 。 该 
网 络 学 习 的 目标 函数 为 
1 N 
E= Pa (3) 
@=¥ -Y=Y -P(X,) (4) 
其 中 : pb 为 遗忘 因子 ， 为 X; 对 应 的 真实 值 ，e; 为 真实 值 与 期 
望 输出 值 的 误差 。 
中 心 C;、 宽 度 X;、 权 值 w 学 习 友 代 方法 如 下 : 
C=C+A FE) =G + pz -oc (5) 
2m， 
5=XtAFOO=X+ OOOIX -CT (0) 
= 0@+A, F(X)= 0,+9.(X) (7) 


2 ”基于 二 分 搜索 密度 峰 的 聚 类 算法 的 RBFNN 模型 


2.1 


二 分 搜索 密度 峰 的 聚 类 算法 


文献 [19] 提 出 基于 密度 峰值 和 距离 的 快速 聚 类 算法 ， 使 月 
昌 集 是 所 有 点 及 样本 数据 两 点 间距 离 构成 的 
主要 体现 数值 
K 角 


的 距离 样本 数 


余弦 相似 度 计 算数 所 


和 矩阵。 其 利用 的 欧式 距离 计算 数据 点 间 的 距离 ， 
的 绝对 差异 ， 不 能 很 好 的 体现 维度 之 间 的 差异 。 


上 


本 文 利用 
昌 集 点 间 的 距离 ， 对 绝对 的 数值 不 敏感 ， 


更 多 的 从 方向 上 或 维度 间 相 对 上 
样本 数据 集 Xs = (Xiy,X24a…Xia) 利 


们 


昌 又 分 差异 ， 采用 


n 个 d 维 


的 


用 RBF 作为 隐藏 层 单元 的 “ 基 ” 隐藏 层 对 输入 数据 进行 转换 ， 
将 低 维 的 输入 数据 自动 地 转换 到 高 维 的 空间 内 。RBFNN 的 激 
活 函 数 采 用 高 斯 函数 ， 可 用 如 下 数学 公式 表示 为 

[x -cl 
20° 


p(XN)= exp( ,N=1,2,…N; j=1,2,.…k) (1) 


| = 2 He a 
其 中 : Xw = (Xi,X，…,X,) 是 输入 数据 ，|X, =- Ci| 是 欧 氏 范 数 ; 


斯 函数 中 心 ; 斯 函数 方差 。 
对 于 输入 数据 样本 XX,， 则 RBFNN 的 


Ci 是 高 0 征 局 


期 望 输出 结果 可 用 


D(X XY)= 
| 1 
1 n DOXX) 
Nr = 2 3 DXX) 
于 
n-l n DCX XI) 


维和 矩阵 的 距离 样本 集 Sscn_1)/2 。 夹 


余弦 数学 表示 如 下 : 


用 夹 角 余 弦 距 离 构造 如 下 


(8) 


9) 


2 


[Ls | 


5.00 


C) 根 寺 
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其 聚 类 算法 有 两 个 前 提 假 设 ， 一 是 聚 类 中 心 的 局 部 密度 高 
于 其 周围 的 样本 点 的 局 部 密度 ;二 是 聚 类 中 心 与 比 其 局 部 密度 


还 高 的 点 间 的 距离 相对 较 大 。 其 聚 类 效果 可 以 检测 出 任意 形状 
的 类 艇 。 该 聚 类 方法 根据 密度 和 距离 构 画 出 的 决策 分 布 图 , 将 


选择 明显 远离 数据 样本 集 大 部 分 的 数据 样本 点 且 位 于 决策 分 布 
图 右上 角 区 域 的 密度 峰 作 为 初始 聚 类 中 心 ， 按 离 最 近邻 的 高 密 
度 的 最 小 距离 规划 到 相应 的 类 簇 中 。 其 算法 虽然 简单 有 效 ， 但 
却 需要 人 工 选取 聚 类 中 心 ， 这 样 对 于 同一 批 数据 可 能 会 因 人 不 
选取 的 中 心 也 不 同 ， 同 时 可 能 会 出 现 一 个 类 被 错误 地 分 成 多 
个 簇 类 的 特殊 情况 。 为 了 避免 多 余 的 簇 类 中 心 , 本 文 综合 考虑 
P; 和 6; 的 值 。 提 出 相 邻 聚 类 间 的 变化 值 小 于 0.01 时 停止 搜索 
密度 峰 聚 类 。 本 文 用 到 的 参数 和 实现 聚 类 的 步骤 如 下 : 

局 部 密度 定义 为 弛 


P=2X(dy—d.) (10) 


可 


1 (x<0) 
0 (>0)” 


sop x -| 这 个 公式 说 明 找 到 与 第 i 个 样本 数据 


点 间 的 距离 小 于 4. 的 样本 数据 点 的 个 数 ， 其 中 4. 为 截断 距离 ， 
对 于 选取 一 个 4. 的 原则 是 使 得 每 个 数据 点 的 “邻居 “个 数 均 约 
为 数据 点 总 数 的 1%-3%。 本 文 设 定 的 值 为 式 (9) 所 有 点 的 相互 距 
离 中 由 小 到 大 排序 占 总 数 2% 位 置 的 距离 数值 。 

与 高 密度 点 间 的 距离 定义 为 


$= min (ds) (11) 


即 找到 比 第 i 个 样本 数据 点 的 局 部 密度 都 大 的 所 有 样本 数 


据点 中 ， 与 第 i 个 样本 数据 点 间 的 距离 的 最 小 值 。 如 果 对 于 具 


有 最 大 密度 的 样本 数据 点 , 通常 取信 =maX(4y) 。 为 了 统一 标准 ， 


将 5 的 值 进行 归 一 化 [0,1]。 
4=D0 (12) 
聚 类 相 邻 之 间 差 值 为 
全 = 十 -人 和 0.01 (13) 
其 中 : 么 值 越 大 ， 其 对 应 的 数据 样本 点 越 可 能 是 数据 中 心 点 。 
因此 对 如 进行 排序 , 取 多 最 大 两 个 值 的 数据 样本 点 作为 聚 类 中 
心 ， 然 后 按 离 最 近邻 的 高 密度 的 最 小 距离 规划 到 相应 的 两 个 类 
簇 中 , 聚 类 后 保存 第 一 类 簇 的 聚 类 中 心 及 艇 类 数据 样本 ,将 男 一 
个 聚 类 数据 样本 继续 按 上 述 的 方法 聚 类 ， 直 到 相 邻 间 的 变化 很 
小 即 满足 i 条 件 为 止 , 最 终 获 得 的 类 簇 数目 个 数 和 类 簇 中心 位 
置 值 。 
具体 步骤 如 下 : 
输入 : 实验 样本 数据 集 Xs = (Xis, Xa*…Xiy) 。 
输出 : 聚 类 结果 中 心 值 C=(Qw Co…Cu) ,k 为 聚 类 个 数 。 
a) 按 照 式 (8) 计算 任意 两 数据 样本 之 间 的 距离 di; ， 构 造 
出 式 (9) 的 三 维和 矩阵 数据 集 Sxcn_1)/2 ; 
b) 分 别 按照 式 (10〉 (11)， 计 算 每 个 数据 样本 的 局 部 密度 
Pi 及 该 点 到 具有 更 高 局 部 密度 的 数据 样本 的 最 小 距离 6 ; 


个 值 的 数 


一 
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居 式 (12) 计算 和 4 值 ， 并 进行 降序 排列 ， 取 和 最 大 两 


居 样 本 作为 两 个 聚 类 
最 小 距离 将 样本 数据 规划 到 相应 的 类 艇 
中 心 及 对 应 的 位 置 ; 
dj) 计算 相 邻 之 间 的 误差 {i ; 
e) 将 另 一 个 聚 类 的 村 
满足 式 (13) 的 结束 条 从 
人 ) 获 得 聚 类 中 心 
下 标 取出 其 对 应 的 Xa 样本 
将 上 述 方法 得 到 的 
车 函数 中 心 和 隐 节 点 个 数 。 
2.2 基于 TSDPCA 的 RBFNN 建立 预测 模型 
RBFNN 模型 的 三 个 参数 ， 输 入 神经 元 个 数 采 
因子 作为 RBFNN 的 输入 神经 元 节点 个 数 ， 隐 藏 
前 为 止 还 没有 找到 准确 、 科 学 的 、 有 效 芯 
是 通过 数值 实验 对 比 和 经 对 


了 光量 


合 妃 


离 ， 数 学 公式 表示 为 


K 
sp=min(d)=, YC Cy 
k=1 


建立 TSDPCA 的 RBFNN 模型 简单 可 归 乡 


P 心 ， 并 按 离 最 近邻 的 高 密度 的 
PF， 并 保存 第 一 类 聚 类 


取 的 聚 类 中 心 个 数 作为 该 模型 的 隐藏 神经 元 上 
扩展 常数 或 宽度 值 ， 可 通过 计算 隐 节 点 数据 中 心 之 间 的 最 小 距 


a) 通 过 均 和 4 


取 综 合 降水 预报 


d) 通 过 式 (14) 计算 


斯 函数 的 RBF 由 


居 相 


降雨 数据 


数据 预 处 理 


则 数据 


和 2 ”基于 TSDPCA 的 RBFNN 妈 


本 数据 集 重复 执行 步骤 b) ~d) ,直到 
为 止 ; 

CG 及 聚 类 个 数 ， 将 聚 类 
FP 的 数据 样本 。 
FPF 心 C 和 聚 类 数目 


作为 


作为 RBFNN 网 


] 10 个 降水 


大 


E 函 数 和 奇异 谱 处 理 的 降水 因子 ， 青 
子 并 进行 归 一 化 处 理 ， 
作为 RBFNN 训练 输入 数据 样本 矩阵 ; 

b) 利 用 夹 角 余弦 计算 数 扩 


采用 本 文 描述 的 TSDPCA 聚 类 方法 找 出 数 扩 


FE 本 点 之 间 的 距离 


8 隐 层 的 扩展 宽度 
E 立 预报 模型 。 


基于 TSDPCA 的 RBFNN 模型 建立 过 程 如 医 


TSDPCA 聚 类 获 了 


数 
和 聚 类 的 数据 中 心 集 


夹 角 余弦 计算 训 
两 点 之 间距 


设置 RBFNN 的 初始 参数 


梯度 下 降 优 化 RBF 网 络 结构 


获得 最 优 权 值 和 阅 值 
v 


出 预测 结果 


E 立 预测 模型 


方法， 大 多 


公式 来 确定 ， 本 文采 用 上 述 聚 类 获 


的 个 数 ， 隐 节点 的 


44) 


j 主 成 分 
是 取出 主要 预 


住 矩 
FP 心 值 和 中 


采用 梯度 下 
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3 ”实验 与 分 析 表 1 五 种 性 能 评价 指标 及 公式 
指标 公式 
3.1 研究 区 域 和 数据 Te 
现 以 广西 桂林 气象 局 提供 的 十 个 站 点 每 月 的 实时 降雨 数据 平均 绝对 误差 NR ae 
(1949 一 2008 年 ) 为 例 ， 建 立 基于 TSDPCA-RBNN 的 预测 模 四 value , Y, is the predicted value 
型 。 其 中 ， 训 练 数 据 总 长 度 为 720 个 ， 影 响 降雨 因子 360 个 ， 
其 中 选取 1949 一 2005 年 的 684 个 月 数据 作为 训练 集 ,2006-2008 平均 相对 误 兰 7 1 *100 
年 36 个 月 数据 作为 测试 集 。 (MAPE) N= 四 
3.2 ”数据 预 处 理 均 方 根 误差 
本 文 对 360 个 降水 因子 是 通过 采用 奇异 谱 分 析 法 (singular (RMSE)) 
spectrum analysis, SSA) 对 降水 原始 序列 重 构 ， 并 利用 均 生 函数 
(mean generating function, MGF ) 对 其 进行 延 拓 Po, 再 采用 80% 洪灾 ; 
的 主 成 分 分 析 法 提取 最 强 的 降水 综合 因子 10 个 ， 作 为 RBFNN ee 0 8- 列 <250 
的 输入 矩阵 向 量 ， 因 RBFNN 的 输入 、 输 出 数据 要 求 在 [0,1]， 1 ly yi<50 
最 后 将 上 述 处 理 后 的 降水 样本 进行 归 一 化 处 理 。 本 人 
二 ”3.3 参数 设置 (error<50mm) 局 0 |[y -YI>50 
2 本 程序 运行 的 环境 是 在 Win7 系统 ，MATLAB 7 软件 ， 实 
验 中 d, 的 初始 “邻居 “个 数值 设 为 2%( 在 1%-3% 之 间 取 值 对 结 4~6 是 分 别 是 三 种 不 同 预 报 模 型 对 2006 一 2008 年 的 月 


果 影 响 不 大 )， 本 程序 TSDPCA 自动 获取 的 数据 中 心 个 数 为 14 ” 降水 预报 结果 与 实际 观察 数据 进行 对 比 ， 从 实验 中 可 以 发 现 三 
个 ,RBFNN 训练 的 隐 节 点 数据 中 心 学 习 系数 TCent=0.01; 隐 节点 。 种 模型 的 模拟 趋势 基本 跟 实际 观察 值 的 趋势 基本 吻合 ， 从 图 
扩展 常数 学 习 系 数 SP = 0.01; 隐 节点 输出 权 值 学 习 系数 ” 4~6 预测 图 可 以 看 出 各 种 模型 对 降水 的 预报 能 力 ， TSDPCA- 
IrYW=0.01; 隐 层 节 点 个 数 为 聚 类 的 数据 中 心 个 数 ; 目标 误差 =0.9; ”RBFNN 的 预报 结果 是 最 好 的 ， 它 跟 实际 观察 值 的 趋势 基本 


一 ”最 大 训练 次 数 =5000。 致 ， 偏 离 是 最 小 的 ， 具 有 良好 的 一 致 性 。 
. = 3.4 结果 分 析 要 和 2006 年 的 月 了 天 人 与 守信 比 
图 3 为 广西 桂林 站 1949 年 到 2008 年 每 个 月 的 平均 降水 量 ， ET 
250|- OLS-RBFNN Vature 
本 文 从 中 可 以 发 现 一 年 中 平均 降雨 量 最 大 的 值 为 230mm 左右 ， NBNN Yohe 


200 上 


最 少 降水 雨量 值 为 50mm 左右 。 通 过 实际 对 比如 果 月 降水 量 大 


= ”于 或 等 于 250mm 将 会 出 现 特大 洪灾 ,如 果 小 于 或 等 于 50mm 将 a . 
“三” 会 出 现 干旱 灾害 。 ol i | | | | 
\ 9 0 1 区 3 4 8 9 10 和 12 


(9849 年 2008) 月 ”go09 征 1-42 个 月 
| | | 图 4 三 种 模型 对 2006 年 的 降雨 量 预测 值 
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5 三 种 模型 对 2007 年 的 降雨 量 预测 


降雨 量 (mm) 


250 T T T 


图 


LD 
| 


为 了 更 好 地 考察 效果 , 本 文 的 TSDPCA-RBFNN 模型 与 K- 
均值 RBFNN 模型 、 正 交 最 小 二 乘 RBFNN 模型 (OLS-RBFNN) 图 7 是 利用 TSDPCA 根据 4 降序 对 数据 集 值 进行 分 类 , 从 
对 月 降水 预报 的 结果 进行 对 比 〈 说 明 : 这 里 的 三 种 方法 中 提 到 ”图 中 发 现 聚 类 数目 达到 14 时 尼 变 化 几乎 趋 于 稳定 ， 说 明 分 为 
的 RBFNN 都 是 通过 梯度 下 降 法 优化 网 络 结构 )。 同时 这 里 还 引 14 个 类 艇 是 比较 合适 的 。 根据 相 邻 之 间 变 化 比较 小 作为 终止 条 
入 表 1 所 示 的 五 种 评价 指标 。 牛 可 以 自动 地 获取 聚 类 数目 和 中 心 点 。 
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_ io 相对 误差 下 降 了 10% 左 右 ， 比 OLS-RBFNN 模型 下 降 了 35%。 
关 — 这 就 说 明 TSDPCA-RBFNN 的 预测 精度 有 很 大 的 提高 ， 能 较 准 
六 | ee 确 的 预测 降水 预报 。 此 外 ， 本 文 对 比 了 三 种 模型 的 收敛 速度 ， 
El 主要 从 模型 训练 拟 合 时 间 和 误差 达到 平稳 的 训练 收敛 次 数 两 个 
量 ] 方面 考虑 ,TSDPCA-RBFNN 模型 的 训练 拟 合 时 间 为 18.6345 秒 
| || 咱 由 收敛 次 数 10 次 ;而 OLS-RFBNN 模型 的 训练 拟 合 时 间 为 61.6801 
"ll LL hl 秒 ,收敛 次 数 180 次 ;K-RBFNN 模型 的 训练 拟 合 时 间 为 44.6128 


2008 年 1-12 个 月 


图 6 三 种 模型 对 2008 年 的 降雨 量 预 测 值 


秒 ， 收 敛 次 数 362 次 。 由 此 可 见 ，TSDPCA-RBFNN 模型 比 其 
他 两 种 模型 的 收敛 速度 快 。 


类 徐 曲 线 表 2 三 种 降水 预测 模型 的 性 能 统计 


TSDPCA- 
i es sera Daca Re 模型 K-RBFENN OLS-RBFNN 
: RBFNN 


训练 数据 
训练 拟 合 时 间 (s) 44.6128 61.6801 18.6345 
测试 数据 ( 2006--2008 ) 
平均 相对 误差 (MAPE) ”42.238% 67.076% 32.84% 
岁 方 根 误差 (RMSE) 44.3435 49.2310 29.3636 


图 7 类 秘 曲 线 平均 绝对 误差 (MAE) 27.75071 41.59739 23.9672 


图 8、9 利用 训练 数据 在 训练 过 程 中 误差 达到 平稳 的 收敛 如 果 以 超过 250 mm 的 月 降雨 量 为 特大 洪灾 来 预测 ， 从 图 
次 数 ， 从 图 中 可 以 看 出 TSDPCA-RBFNN 模型 的 收敛 次 数值 要 4 中 可 以 发 现 ，2006 年 实况 发 生 特大 洪灾 是 4 月 ， 发 生 旱 灾 是 
比 其 他 两 种 模型 收敛 次 数值 小 。 1 月 、10 月 、11 月 和 12 月 ，TSDPCA-RBFNN 模型 中 预测 的 特 
大 洪灾 显示 为 4 月 及 旱灾 为 1 月 、10 月 、11 月 和 12 月 ， 与 实 

两 种 模型 误差 达到 平稳 的 收敛 次 数 ee 
a 一 6 一 K-RBFNN Eror | 4 J ee J 0 | 际 情 况 完全 吻 蝇 o 从 图 4 发 现 TSDPCA-RBFNN 模型 预测 2007 


一 人 一 OLS-RBFNN Eror 


到 | ] 年 特大 洪灾 为 2 月 、4 月 和 5 月 ， 旱 灾 为 8 月 和 9 月 ，2007 年 
实况 特大 洪灾 是 4 月， 旱灾 是 8 月 和 9 月 ， 再 仔细 对 比 发 现 ， 
2007 年 的 2 月 和 5 月 实况 降雨 量 超过 200MM 以 上 ， 说明 雨 水 
量 较 多 ， 所 以 该 模型 预测 效果 几乎 跟 实况 基本 吻合 。 从 图 6 发 
现 2008 年 的 预测 特大 洪灾 与 实况 都 是 4 月 ， 预 测 的 旱灾 与 实 
况 旱 灾 也 比较 接近 。 从 这 三 个 图 中 可 以 发 现 ， 相 比 其 他 两 个 预 
测 模 型 , 本文 提出 的 TSDPCA-RBFNN 预测 模型 的 精确 度 更 高 
预报 更 稳定 。 该 模型 能 为 防洪 防 旱灾 害 和 径流 预报 等 提供 一 个 
重要 的 参考 价值 ， 可 作为 一 种 较 好 的 预报 工具 。 
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图 8 两 种 模型 误差 达到 平稳 的 收敛 次 数 


TSDPCA-RBFNN 模 型 误差 达到 平稳 的 收敛 次 数 
T T 


| |。 4 结束语 
时 so| 1 降水 因 受 到 众多 不 同 因素 的 综合 影响 ， 而 且 具 有 非 线 性 的 
ol | ”典型 特征 ， 而 RBFNN 具有 较 强 的 非 线性 关系 ， 以 及 参数 少 、 
| | 自学 习 和 自 适 应 等 能 力 ,能 适用 于 这 类 气象 因素 的 建 模 和 预报 。 
| | ”但 在 实际 的 应 用 研究 中 ， 一 般 都 是 采用 手工 试 凑 的 方法 来 进行 

' ! We s ”设计 RBF 算法 结构 和 调整 训练 参数 。 需 要 大 量 耗 时 的 实验 探索 

才能 找到 合适 的 网 络 结构 。 针 对 RBFNN 网 络 结构 和 初始 化 参 


图 9 TSDPCA-RBFNN 模型 误差 达到 平稳 的 收敛 次 数 


数 难以 客观 确定 的 不 足 ,特别 是 隐藏 层 的 基 函 数 中 心 的 选取 问 

表 2 给 出 了 三 种 模型 在 训练 过 程 中 拟 合 的 时 间 以 及 对 2006 题 对 整个 RBF 网 络 的 是 否 成 功 的 关键 所 在 。 本 文 提出 的 

年 到 2008 年 这 三 年 的 月 平均 降雨 量 在 三 种 不 同 模型 中 预测 误 TSDPCA 方法 能 自动 快速 、 准 确 的 获取 聚 类 中 心 和 聚 类 个 数 ， 

差 的 精确 度 , 可 以 看 出 , TSDPCA-RBFNN 平均 相对 误差 、 均 方 克服 了 RBFNN 不 足 。 结 合 梯度 下 降 法 优化 RBFNN 结构 建立 
根 误 差 和 平均 绝对 误差 都 是 最 小 的 ， 比 K-RBFNN 模型 的 平均 。 ”预测 模型 。 通 过 实验 研究 ， 得 出 以 下 结论 : 
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a) 从 RBFNN 网 络 的 收敛 速度 来 看 ， 与 传统 的 K 均值 
RBFNN 模型 和 OLS-RBFNN 模型 比较 ， 基 于 TSDPCA 的 
RBFNN 模型 对 确定 簇 类 数目 和 基 函 数 中心 等 方面 有 一 定 的 优 
势 ， 同 时 网 络 的 收敛 速度 和 预测 精度 都 有 比较 明显 的 提高 。 

b) 对 于 广西 月 降水 预报 而 言 ， 改 进 的 RBFNN 模型 预报 在 
月 降水 量 的 平均 相对 误差 的 精度 上 有 较 大 的 提高 ，2006,2007， 
2008 年 三 年 对 洪灾 旱灾 的 预测 几乎 跟 实 际 完全 吻合 , 为 在 不 确 
定 因 素 非 线性 较 强 的 长 期 降水 预报 提供 了 一 种 新 的 参考 方法 。 
c) 本 文 应 用 的 TSDPCA 优化 RBFNN 对 月 降水 量 建立 预测 
模型 时 ， 采 用 余弦 相似 度 公式 代 蔡 欧式 距离 公式 来 计算 降水 数 
据 样本 间 的 距离 ， 可 进一步 分 析 研 究 数 据 之 间 的 相似 性 ， 以 及 
综合 一 些 智 能 优化 算法 优化 该 模型 网 络 的 隐 节 点 数 ， 以 更 进 
步 提高 RBFNN 模型 的 预测 精度 ， 还 有 就 是 4d. 闵 值 没有 确定 的 
方法 ， 有 待 进 
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